An Artificial Immune System Based on Information Theory for Keyword Extraction from Text Documents Sistema Inmune Artificial Basado en Teoría de la Información para la Extracción de Palabras Clave de Documentos de Texto

نویسنده

  • Andrés Romero
چکیده

This paper presents a model for keyword extraction, extending the basic concepts commonly used in this task, in order to get a formal background that allows determining the importance of the keywords to the documents. The proposed model combines an artificial immune system with a mathematical background based on information theory; this new model has the advantage that does not need any domain knowledge, neither the use of a stopword list or any previous information about the content of the documents. The final result is a set of keywords for each category into the corpus used. Keywords—Keyword Extraction, Artificial Immune Systems, Information Theory.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Proyecto de indexado automático para documentos en el campo de la física de altas energías

Este proyecto consiste en el desarrollo de un sistema automático de indexado por asignación. El indexado por asignación consiste en la selección de palabras clave dentro de un léxico controlado (en nuestro caso un tesauro) que describan y resuman los conceptos más importantes tratados en un texto dado. El sistema propone palabras clave según el tesauro del laboratorio alemán DESY (Deutsche Elek...

متن کامل

Un Sistema de Extracción de Información Basado en Ontologías para Documentos en el Dominio de las Tecnologías de Información An Ontology-Based Information Extractor for Data-Rich Documents in the Information Technology Domain

This paper presents an information extraction method, suitable for data-rich documents, based on the knowledge represented in a domain ontology. The extractor combines a fuzzy string matcher and a word sense disambiguation (WSD) algorithm. The fuzzy string matcher finds mentions of terms combining character-level and token-level similarity measures dealing with non-standardized acronyms and inc...

متن کامل

Hipermedia, Adaptación, Constructivismo e Instructivismo

Los sistemas tutores inteligentes representan a los sistemas interactivos para el aprendizaje instructivo que han surgido hasta el momento. Los sistemas hipermedia permiten la incorporación de nuevos métodos de aprendizaje, como el constructivo, que hasta ahora habían estado hibernando. La piedra angular de este enfoque reside en la cesión del control al alumno sobre su aprendizaje. En el artíc...

متن کامل

Comparación de Representaciones Interválicas Hansonianas para Recuperación de Información Musical

La similitud melódica es un concepto importante a considerar en la recuperación de información musical. Algunas de las posibles aplicaciones son sistemas basados en contenido desarrollados para administración de derechos de autor, detección de plagio de ideas ya expuestas por un artista en el pasado, la asistencia a la composición, etc. Existen varias técnicas expuestas en similitud melódica qu...

متن کامل

Un Algoritmo Genético para Aprendizaje de un Sistema Basado en Reglas Difusas tipo Takagi Sugeno

Resumen— Este trabajo presenta un método de aprendizaje de la base de conocimiento de un Sistema Basado en Reglas Difusas tipo Takagi Sugeno mediante ejemplos. Para el aprendizaje de las particiones difusas utilizadas en los antecedentes se utiliza un Algoritmo Genético que incluye tanto el número de etiquetas de cada partición como la semántica de dichas etiquetas. Para el aprendizaje de las r...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2007